ภาษาไทย หรือ ภาษาไทยกลาง เป็นภาษาในกลุ่มภาษาไท สาขาย่อยเชียงแสน ซึ่งเป็นกลุ่มย่อยของตระกูลภาษาขร้า-ไท และเป็นภาษาราชการ และภาษาประจำชาติของประเทศไทย มีการสันนิษฐานว่าภาษาในตระกูลนี้มีถิ่นกำเนิดจากทางตอนใต้ของประเทศจีน และนักภาษาศาสตร์บางส่วนเสนอว่า ภาษาไทยน่าจะมีความเชื่อมโยงกับตระกูลภาษาออสโตร-เอเชียติก ตระกูลภาษาออสโตรนีเซียน และตระกูลภาษาจีน-ทิเบต
ภาษาไทยเป็นภาษาที่มีระดับเสียงของคำแน่นอนหรือวรรณยุกต์เช่นเดียวกับภาษาจีน และออกเสียงแยกคำต่อคำ
ภาษาไทยปรากฏครั้งแรกในพุทธศักราช 1826 โดยพ่อขุนรามคำแหง และปรากฏอย่างสากลและใช้ในงานของราชการ เมื่อวันที่ 31 มีนาคม พุทธศักราช 2476 ด้วยการก่อตั้งสำนักงานราชบัณฑิตยสภาขึ้น และปฏิรูปภาษาไทย พุทธศักราช 2485
ภาษาไทยจัดอยู่ในกลุ่มภาษาไท (Tai languages) ภาษาหนึ่ง ซึ่งเป็นสาขาย่อยของตระกูลภาษาขร้า-ไท ภาษาไทยมีความสัมพันธ์อย่างใกล้ชิดกับภาษาในกลุ่มภาษาไทตะวันตกเฉียงใต้ภาษาอื่น ๆ เช่น ภาษาลาว ภาษาผู้ไท ภาษาคำเมือง ภาษาไทใหญ่ เป็นต้น รวมถึงภาษาตระกูลไทอื่น ๆ เช่น ภาษาจ้วง ภาษาเหมาหนาน ภาษาปู้อี ภาษาไหล ที่พูดโดยชนพื้นเมืองบริเวณไหหนาน กวางสี กวางตุ้ง กุ้ยโจว ตลอดจนยูนนาน ไปจนถึงเวียดนามตอนเหนือ ซึ่งสันนิษฐานว่าจุดกำเนิดของภาษาไทยน่าจะมาจากบริเวณดังกล่าว
ราวพุทธศตวรรษที่ 13-15 ได้มีการอพยพของผู้พูดภาษากลุ่มไทลงมาจากจีนตอนใต้ มายังเอเชียตะวันออกเฉียงใต้ โดยนำพาภาษากลุ่มไทลงมาด้วย ภาษาที่ชนกลุ่มไทกลุ่มนี้พูดได้รับการสืบสร้างเป็นภาษาไทตะวันตกเฉียงใต้ดั้งเดิม ซึ่งในเวลาต่อมาได้รับอิทธิพลจากภาษาตระกูลออสโตรเอเชียติก ที่พูดโดยชาวออสโตรเอเชียติก และอยู่อาศัยในเอเชียตะวันออกเฉียงใต้อยู่เดิม รวมถึงได้รับอิทธิพลจากภาษาทางวรรณกรรม คือ ภาษาสันสกฤต และ ภาษาบาลี จนพัฒนามาเป็นภาษาไทยในปัจจุบัน
ภาษาไทยในอดีตมีระบบเสียงต่างจากภาษาไทยปัจจุบันอย่างชัดเจน ซึ่งมีประเด็นสำคัญต่อไปนี้
ระบบเสียงข้างต้นมีความสอดคล้องกันกับอักษรในศิลาจารึกพ่อขุนรามคำแหง นั่นคือ มีการใช้อักษร ฃ และ ฅ แยกกับ ข และ ค อย่างชัดเจน บ่งบอกว่าภาษาไทยในสมัยที่มีการสร้างจารึกดังกล่าว หน่วยเสียงพยัญชนะเหล่านี้ต้องแตกต่างกัน นอกจากนี้ยังอธิบายได้ว่า เหตุใดวรรณยุกต์ในภาษาไทยในจารึกสมัยสุโขทัยจึงมีวรรณยุกต์เพียง 2 รูป (เอกและโท) เท่านั้น เป็นเพราะว่าภาษาไทยเก่ามีวรรณยุกต์เพียงสามเสียงเท่านั้น (เสียงสามัญไม่เขียนรูปวรรณยุกต์)
อย่างไรก็ตาม หน่วยเสียง /x/ และ /ɣ/ น่าจะมีการสูญหายไปในอย่างรวดเร็วในสมัยพระยาลิไท โดยเกิดการรวมกับหน่วยเสียง /kʰ/ และ /g/ โดยสังเกตได้จากการใช้รูปพยัญชนะ ฃ สลับกับ ข และ ฅ สลับกับ ค ในศิลาจารึกสมัยพระยาลิไท บ่งบอกว่าหน่วยเสียงทั้งสองคู่ไม่มีความแตกต่างกันอีกต่อไป ปัจจุบันจึงมีการเลิกใช้ตัวอักษร ฃ และ ฅ
ระบบเสียงวรรณยุกต์สามเสียงสอดคล้องกับฉันทลักษณ์ในสมัยอยุธยาตอนต้น เช่นการบังคับเอกโทในโคลงสี่สุภาพ ในวรรณกรรมสมัยอยุธยาตอนต้นที่เขียนในโคลงสี่สุภาพ ยังไม่ปรากฏว่ามีการใช้คำเอกโทษหรือโทโทษเกิดขึ้น จึงสันนิษฐานได้ว่าระบบเสียงของภาษาไทยที่ใช้ในสมัยอยุธยาตอนต้นยังคงเป็นระบบเสียงแบบเก่าอยู่ ก่อนที่จะมีการเปลี่ยนแปลงของระบบเสียงภาษาไทยต่อไปในสมัยอยุธยาตอนกลาง อนึ่ง เสียงสระ ใ /aɰ/ และ ไ /aj/ ในสมัยอยุธยาตอนต้นยังคงรักษาความแตกต่างไว้ได้เช่นกัน โดยสังเกตได้จากการที่คำที่มีรูปสระ ไ และ ใ จะไม่สัมผัสกัน
ในสมัยอยุธยาตอนต้น (พุทธศตวรรษที่ 21) ได้เกิดการเปลี่ยนแปลงของระบบเสียงภาษาไทยเก่าขึ้น นับเป็นจุดเปลี่ยนผ่านจากภาษาไทยเก่าไปเป็นภาษาไทยสมัยใหม่ โดยมีขั้นตอนการเปลี่ยนแปลงดังนี้
ภาษาไทยถิ่นกลางมีการแตกตัวและการยุบรวมของเสียงวรรณยุกต์ที่มีลักษณะเฉพาะ แบ่งแยกได้จากภาษาถิ่นภาคอื่น ๆ ได้แก่ การแตกตัวของเสียงวรรณยุกต์ *A ออกเป็นสองเสียงที่ต่างกันระหว่างพยัญชนะเสียงไม่ก้องที่มีลม (/pʰ tʰ t͡ɕʰ kʰ h f s x m̥ n̥ ɲ̊ ŋ̊ ʍ l̥/) กับเสียงไม่ก้องที่ไม่มีลม (/p t t͡ɕ k ʔb ʔd ʔj ʔ/) และมีการยุบรวมของเสียงวรรณยุกต์ *B2 (เอก-ก้อง) และ *C1 (โท-ไม่ก้อง) อีกด้วย จึงเป็นเหตุผลว่าทำไมคำว่า ค่า กับ ข้า หรือคำว่า น่า กับ หน้า จึงออกเสียงวรรณยุกต์เป็นเสียงเดียวกันในภาษาไทยถิ่นกลาง แตกต่างจากภาษาไทยถิ่นเหนือและอีสานที่มีการแตกตัวและยุบรวมของเสียงวรรณยุกต์ที่ต่างไปจากนี้ จึงออกเสียงวรรณยุกต์ของทั้งสองคำนี้ต่างกันไปด้วย
สำหรับภาษาไทยถิ่นกลางบางสำเนียง เช่น สำเนียงกรุงเทพ และสำเนียงอยุธยา เป็นต้น มีการยุบรวมเสียงวรรณยุกต์ *A1 ของพยัญชนะเสียงไม่ก้อง ไม่มีลม (/p t t͡ɕ k ʔb ʔd ʔj ʔ/) กับเสียงวรรณยุกต์ *A2 ของพยัญชนะเสียงก้อง (/b d d͡ʑ g v z ɣ m n ɲ ŋ r w l j/) ด้วย จึงเป็นเหตุผลว่าทำไมคำว่า กา กับ คา จึงออกเสียงวรรณยุกต์เหมือนกัน (เสียงสามัญ) แต่ออกเสียงวรรณยุกต์ต่างจากคำว่า ขา ซึ่งเป็นเสียงจัตวา ในขณะที่ภาษาไทยถิ่นกลางบางสำเนียง เช่น สำเนียงสุพรรณ (ในผู้พูดบางราย) มีการออกเสียงวรรณยุกต์ของคำว่า กา กับ คา ที่ต่างกันอยู่ นั่นคือยังไม่มีการยุบรวมของเสียงวรรณยุกต์ *A1 และ *A2 ดังกล่าว การเปลี่ยนแปลงดังกล่าวทำให้ภาษาไทยกรุงเทพปัจจุบันมีเสียงวรรณยุกต์ที่แตกต่างกัน 5 หน่วยเสียง และสำเนียงสุพรรณ (ในผู้พูดบางราย) มีเสียงวรรณยุกต์ 6 หน่วยเสียง
รูปแบบการแตกตัวของเสียงวรรณยุกต์ที่แตกต่างกัน ของภาษาไทยสำเนียงกรุงเทพ และสำเนียงสุพรรณบุรี สรุปได้ตามตารางต่อไปนี้ (ให้เสียงวรรณยุกต์เดียวกันมีสีเดียวกัน และวรรณยุกต์ที่ปรากฏในตารางเป็นเสียงวรรณยุกต์ในปัจจุบัน)
แม้ว่าจะมีการการเปลี่ยนแปลงของระบบเสียงวรรณยุกต์จากภาษาไทยเก่ามาเป็นภาษาไทยสมัยใหม่ แต่อักขรวิธีของภาษาไทยยังคงรูปเขียนเช่นเดิม ทำให้รูปเขียนและเสียงอ่านมีความไม่สอดคล้องกันขึ้น ยกตัวอย่างเช่น คำว่า ข้า กับ ค้า ที่ออกเสียงวรรณยุกต์ต่างกัน ทั้ง ๆ ที่มีรูปวรรณยุกต์โทเช่นเดียวกัน เกิดจากการที่ทั้งสองคำนี้เคยมีเสียงวรรณยุกต์เดียวกัน แต่มีเสียงพยัญชนะต้นที่แตกต่างกัน คือเสียง ข /kʰ/ และ ค /g/ ในภาษาไทยเก่า ความไม่สอดคล้องกันระหว่างรูปเขียนและเสียงอ่าน ทำให้เกิดระบบไตรยางศ์ ขึ้น โดยเป็นระบบการจัดหมวดหมู่รูปพยัญชนะอักษรไทยที่จัดให้รูปวรรณยุกต์หนึ่ง ๆ มีการออกเสียงที่แตกต่างกันได้เป็น 2 เสียง ขึ้นอยู่กับรูปพยัญชนะต้นของคำนั้น ๆ ซึ่งเป็นไปตามรูปแบบการแตกตัวและยุบรวมของหน่วยเสียงพยัญชนะและสระข้างต้น
หลักฐานที่บ่งบอกถึงเสียงวรรณยุกต์ในสมัยอยุธยามีน้อยมาก ระบบไตรยางศ์แบบเดียวกันกับภาษาไทยปัจจุบันนี้ถูกกล่าวถึงเป็นอย่างช้าสุดในตำราจินดามณี จากการสืบสร้างเสียงวรรณยุกต์จากตำราจินดามณี พบว่ามีหน่วยเสียงวรรณยุกต์ 5 เสียง และมีการแตกตัวของเสียงวรรณยุกต์คล้ายคลึงกับภาษาไทยปัจจุบัน แต่ระดับเสียงและรูปร่างเสียงวรรณยุกต์ (contour) ยังคงมีความแตกต่างจากภาษาไทยปัจจุบันอยู่พอสมควร เสียงวรรณยุกต์สมัยนี้อาจมีความคล้ายคลึงกับสำเนียงพากย์โขน (วริษา กมลนาวิน, 2546)
และได้เสนอว่าระบบวรรณยุกต์ในสมัยอยุธยามีรูปแบบการแตกตัวที่ต่างไปจากภาษาไทยปัจจุบัน คือ เสียงวรรณยุกต์ของพยางค์ที่มีอักษรต่ำ คำตาย เสียงสระสั้น กับ พยางค์ที่มีอักษรต่อ คำตาย เสียงยาว มีเสียงเดียวกัน (ตัวอย่างเช่น คำว่า คัด กับ คาด เคยมีเสียงวรรณยุกต์เดียวกัน) ซึ่งสรุปการแตกตัวได้ดังนี้
ในสมัยที่จอมพล ป. พิบูลสงคราม เป็นนายกรัฐมนตรี มีการปฏิรูปภาษาไทยโดยสภาวัฒนธรรมแห่งชาติเมื่อ พ.ศ. 2485 มีการเปลี่ยนแปลงการสะกดคำมากมาย การเปลี่ยนแปลงหลัก ๆ ที่สังเกตได้มีดังนี้
หลังจากจอมพล ป. พิบูลสงคราม หลุดจากอำนาจหลังสงครามโลกครั้งที่สองยุติ รัฐนิยมก็ถูกยกเลิกไปโดยปริยาย อักขรวิธีภาษาไทยได้กลับไปใช้แบบเดิมอีกครั้งหนึ่ง
ภาษาไทยมาตรฐานแบ่งแยกรูปแบบเสียงพยัญชนะก้องและพ่นลม เสียงกักและเสียงผสมเสียงแทรก เป็นสามประเภทดังนี้
หากเทียบกับภาษาอังกฤษ โดยทั่วไปมีเสียงแบบที่สองกับสามเท่านั้น เสียงแบบที่หนึ่งพบได้เฉพาะเมื่ออยู่หลัง เอส (S) ซึ่งเป็นเสียงแปรของเสียงที่สอง
เสียงพยัญชนะต้นมี 21 เสียง ตารางด้านล่างนี้บรรทัดบนคือสัทอักษรสากล บรรทัดล่างคืออักษรไทยในตำแหน่งพยัญชนะต้น
ถึงแม้ว่าพยัญชนะไทยมี 44 รูป 21 เสียงในกรณีของพยัญชนะต้น แต่ในกรณีพยัญชนะสะกดแตกต่างออกไป สำหรับเสียงสะกดมีเพียง 8 เสียง เรียกว่า มาตรา เสียงพยัญชนะก้องเมื่ออยู่ในตำแหน่งตัวสะกด ความก้องจะหายไป
ในบรรดาพยัญชนะไทย นอกจาก ฃ และ ฅ ที่เลิกใช้แล้ว ยังมีพยัญชนะอีก 6 ตัวที่ใช้เป็นตัวสะกดไม่ได้คือ ฉ ผ ฝ ห อ ฮ ดังนั้นตัวสะกดจึงเหลือเพียง 36
แต่ละพยางค์ในคำหนึ่ง ๆ ของภาษาไทยแยกออกจากกันอย่างชัดเจน (ไม่เหมือนภาษาอังกฤษที่พยัญชนะสะกด อาจกลายเป็นพยัญชนะต้นในพยางค์ถัดไป หรือในทางกลับกัน) ดังนั้นพยัญชนะหลายตัวของพยางค์ที่อยู่ติดกัน จะไม่รวมกันเป็นกลุ่มพยัญชนะเลย
ภาษาไทยมีกลุ่มพยัญชนะเพียงไม่กี่กลุ่ม ประมวลคำศัพท์ภาษาไทยดั้งเดิมระบุว่ามีกลุ่มพยัญชนะ (ที่ออกเสียงรวมกันโดยไม่มีสระอะ) เพียง 11 แบบเท่านั้น เรียกว่า พยัญชนะควบกล้ำ หรือ อักษรควบกล้ำ
เราสามารถสังเกตได้ว่า กลุ่มพยัญชนะเหล่านี้ถูกใช้เป็นพยัญชนะต้นเท่านั้น ซึ่งมีเสียงพยัญชนะตัวที่สองเป็น ร ล หรือ ว และกลุ่มพยัญชนะจะมีเสียงไม่เกินสองเสียงในคราวเดียว การผันวรรณยุกต์ของคำขึ้นอยู่กับไตรยางศ์ของพยัญชนะตัวแรก
เสียงสระในภาษาไทยมาตรฐานแบ่งออกเป็น 3 ชนิดคือ สระเดี่ยว สระประสม และสระเกิน สะกดด้วยรูปสระพื้นฐานหนึ่งตัวหรือหลายตัวร่วมกัน (ดูที่ อักษรไทย)
สระประสม คือสระที่เกิดจากสระเดี่ยวสองเสียงมาประสมกัน เกิดการเลื่อนของลิ้นในระดับสูงลดลงสู่ระดับต่ำ ดังนั้นจึงสามารถเรียกอีกชื่อหนึ่งว่า "สระเลื่อน" มี 3 เสียงดังนี้
ในบางตำราจะเพิ่มสระสระประสมเสียงสั้น คือ เ–ียะ เ–ือะ –ัวะ ด้วย แต่ในปัจจุบันสระเหล่านี้ปรากฏเฉพาะคำเลียนเสียงเท่านั้น เช่น เพียะ เปรี๊ยะ ผัวะ เป็นต้น
เสียงวรรณยุกต์ในคำตายสามารถมีได้แค่เพียง 3 เสียงวรรณยุกต์ คือ เสียงเอก เสียงโท และ เสียงตรี โดยขึ้นอยู่กับความสั้นความยาวของสระ เสียงเอกสามารถออกเสียงควบคู่กับได้สระสั้นหรือยาว เสียงตรีสามารถออกเสียงควบคู่กับสระสั้น และ เสียงโทสามารถออกเสียงควบคู่กับสระยาว เช่น
แต่อย่างใดก็ดี ในคำยืมบางคำที่มีรากศัพท์มาจากภาษาอังกฤษ คำตายสามารถมีเสียงตรีควบคู่กับสระยาว และเสียงโทควบคู่กับสระสั้นได้ด้วย เช่น
ทั้งนี้คำที่มีรูปวรรณยุกต์เดียวกัน ไม่จำเป็นต้องมีระดับเสียงวรรณยุกต์เดียวกัน ขึ้นอยู่กับระดับเสียงของอักษรนำด้วย เช่น ข้า (ไม้โท) ออกเสียงโทเหมือน ค่า (ไม้เอก) เป็นต้น
คำควบกล้ำ หรือ อักษรควบ หมายถึง พยัญชนะสองตัวเขียนเรียงกันอยู่ต้นพยางค์ และใช้สระเดียวกัน เวลาอ่านออกเสียงกล้ำเป็นพยางค์เดียวกัน เสียงวรรณยุกต์ของพยางค์นั้นจะผันเป็นไปตามเสียงพยัญชนะตัวหน้าคำควบกล้ำ (อักษรควบ) มี 2 ชนิด คือ
คำควบแท้ ได้แก่ พยัญชนะ ร ล ว ควบกับพยัญชนะตัวหน้า ประสมสระตัวเดียวกัน เวลาอ่านออกเสียงพยัญชนะทั้งสองตัวพร้อมกัน
คำควบไม่แท้ ได้แก่ พยัญชนะ ร ควบกับพยัญชนะตัวหน้าประสมสระตัวเดียวกัน เวลาอ่านไม่ออกเสียง ร ออกเสียงเฉพาะตัวหน้า หรือมิฉะนั้น ก็ออกเสียง เป็นเสียงอื่นไป
ภาษาไทยเป็นภาษาคำโดด คำในภาษาไทยจะไม่มีการเปลี่ยนแปลงรูป ไม่ว่าจะอยู่ในกาล (tense) การก (case) มาลา (mood) วาจก (voice) หรือบุรุษ (person) ใดก็ตาม คำในภาษาไทยไม่มีลิงค์ (gender) ไม่มีพจน์ (number) ไม่มีวิภัตติปัจจัย แม้เป็นคำที่รับมาจากภาษาผันคำ (ภาษาที่มีวิภัตติปัจจัย) เช่น ภาษาบาลี และภาษาสันสกฤต เมื่อนำคำที่รับมานั้นมาใช้ในภาษาไทย ก็จะไม่มีการเปลี่ยนแปลงรูป
คำในภาษาไทยหลายคำไม่สามารถกำหนดหน้าที่ของคำได้อย่างตายตัว จำเป็นต้องอาศัยบริบทเข้าช่วยในการพิจารณา เมื่อต้องการจะผูกประโยค ก็นำเอาคำแต่ละคำมาเรียงติดต่อกันเข้า ภาษาไทยมีโครงสร้างแตกกิ่งไปทางขวา คำคุณศัพท์จะวางไว้หลังคำนาม ลักษณะทางวากยสัมพันธ์ โดยรวมแล้วจะเป็นแบบ 'ประธาน-กริยา-กรรม' (subject-verb-object หรือ SVO)
ลักษณะทางวากยสัมพันธ์ หรือการเรียงลำดับคำในประโยค โดยรวมแล้วจะเรียงเป็น 'ประธาน-กริยา-กรรม' (subject-verb-object หรือ SVO) อย่างไรก็ตาม ในบางกรณี เช่น ในกรณีที่มีการเน้นความหมายของกรรม (topicalization) สามารถเรียงประโยคเป็น 'กรรม-ประธาน-กริยา' (object-subject-verb หรือ OSV) ได้ด้วย แต่ต้องใช้คำชี้เฉพาะเติมหลังคำที่เป็นกรรมคำนั้น เช่น
ภาษาไทยเป็นภาษาหนึ่งที่มีการยืมคำมาจากภาษาอื่น ๆ ค่อนข้างสูงมาก มีทั้งแบบยืมมาจากภาษาในตระกูลภาษาขร้า-ไท ด้วยกันเอง และข้ามตระกูลภาษา โดยส่วนมากจะยืมมาจากภาษาบาลี ภาษาสันสกฤต และภาษาเขมร ซึ่งมีทั้งรักษาคำเดิม ออกเสียงใหม่ สะกดใหม่ หรือเปลี่ยนความหมายใหม่ อย่างใดอย่างหนึ่งหรือหลายอย่างรวมกัน
บางครั้งเป็นการยืมมาซ้อนคำ เกิดเป็นคำซ้อน คือ คำย่อยในคำหลัก มีความหมายเดียวกันทั้งสอง เช่น
คำจำนวนมากในภาษาไทย ไม่ใช้คำในกลุ่มภาษาไท แต่เป็นคำที่ยืมมาจากกลุ่มภาษาสันสกฤต-ปรากฤต โดยมีตัวอย่างดังนี้
ในรัชสมัยพระบาทสมเด็จพระจุลจอมเกล้าเจ้าอยู่หัว ได้มีวิวัฒนาการต่าง ๆ ทางเทคโนโลยีมากมาย ซึ่งทำให้มีการใช้ภาษาอังกฤษกันอย่างแพร่หลาย อย่างไรก็ตาม ก็ได้มีการบัญญัติศัพท์จากภาษาอังกฤษเป็นภาษาไทย เช่น